home *** CD-ROM | disk | FTP | other *** search
/ Amiga Format CD 31 / Amiga Format CD31 (1998-09-02)(Future Publishing)(GB)(Track 1 of 2)[!][issue 1998-10].iso / -seriously_amiga- / misc / poolmem / developer.readme next >
Text File  |  1998-07-20  |  21KB  |  535 lines

  1. Abstract:
  2.  
  3. This brief document describes how to allocate and deallocate memory correctly,
  4. i.e. in a way compatible to the Os (and, as a result, compatible to PoolMem).
  5. ______________________________________________________________________________
  6.  
  7. The following rules apply to all programs that are supposed to run in an OS
  8. friendly way. I didn't make them up myself. What you find here is more or 
  9. less a copy of the rules taken from the ROM Kernal reference manual, the 
  10. official Amiga developer documentation.
  11.  
  12. Breaking these rules will result in unstable programs, with or without
  13. any additional memory tools. A program that seems to run fine without 
  14. PoolMem, but crashes with PoolMem is, nevertheless, unstable and might crash
  15. in certain situations, even without this tool.
  16.  
  17.  
  18. Allocation of memory:
  19.  
  20. o)    The MEMF_PUBLIC bit:
  21.     Set the MEMF_PUBLIC bit (exec/memory.h). You usually want it!
  22.  
  23.     NOT setting this bit results in memory that is 
  24.     a) *private* to your task, i.e. can't be read from any other task
  25.     b) and can't be read safely within a Forbid()/Permit() or
  26.        Enable()/Disable() pair.
  27.  
  28.     The current Os DOES NOT implement any checks for this rule, neither
  29.     does PoolMem. However, future memory managers might see this bit as
  30.     a hint to assign "virtual memory" to the allocation, i.e. memory that
  31.     can be swapped out to disk.
  32.  
  33.     As an example, VMM requires correct usage of this bit.
  34.  
  35.     All data that is supposed to hold Os structures MUST BE ALLOCATED 
  36.     WITH THE MEMF_PUBLIC flag set, any memory that is passed to other
  37.     tasks, interrupts, exceptions, I/O buffers MUST BE ALLOCATED WITH 
  38.     THIS BIT SET.
  39.  
  40.     The only exception are private structures that are only read
  41.     or written to by your task, that are never passed nor read or 
  42.     written to by other processes or Os functions and that are not 
  43.     accessed with multitasking disabled.
  44.  
  45. o)     Memory flushes:
  46.     Be prepared that a memory allocation might flush unused libraries, 
  47.     fonts and devices from memory. In special, DO NOT USE CLOSED 
  48.     RESORCES. Using a "FindName()" on the exec resource lists IS NOT
  49.     ENOUGH to use a resource.
  50.  
  51.     If you DO NOT want that resources get flushed, set the 
  52.     MEMF_NO_EXPUNGE flag as memory attribute. See exec/memory.h.
  53.  
  54. o)    Memory and custom chips:
  55.     Memory that should be read by the Amiga custom chip set MUST BE
  56.     ALLOCATED with the MEMF_CHIP attribute set or the custom chips 
  57.     won't be able to address this memory. That goes for:
  58.  
  59.     o) display buffers (native bitmaps)
  60.     o) hardware copper lists (but not their gfx abstractions for the
  61.                   CMove(),CWait() etc... family)
  62.     o) image bitmaps (struct IntuiImage->ImageData)
  63.     o) floppy hardware buffers (but since V37 not required for the
  64.                     trackdisk.device I/O buffer)
  65.     o) hardware audio buffers
  66.     o) hardware sprites and image datas of "Bobs"
  67.     o) everything else the custom chip set might access    
  68.  
  69. o)    Order of memory blocks:
  70.     Do not make *any* assumptions about the order in which you get
  71.     memory. The second allocation is not necessarely the higher
  72.     address!
  73.  
  74. o)    The MEMF_FAST bit:
  75.     Do not use the MEMF_FAST bit unnecessary if chip mem would be
  76.     O.K. for you, too. The operating system is smart enough to
  77.     allocate fast memory for you if that is available. It will fall
  78.     back to chip mem if fast mem is not available. There's usually
  79.     no reason to ask for fast mem explicitly.
  80.  
  81. o)    Alignment:
  82.     It is guaranteed that all memory allocated by AllocMem() is aligned
  83.     to two long word boundaries, i.e. the bits 0 to 2 of the address will
  84.     always be zero. NOT MORE! If you need more alignment, see the kludge
  85.     below.
  86.  
  87. o)    Size of buffers:
  88.     Make sure you allocate enough memory even for the worst case. A
  89.     C style string needs n+1 bytes memory to hold a string of length n.
  90.     Some Os functions require, due to bugs, a slightly larger buffer
  91.     than you might think, check the "BUGS" section of the autodocs.
  92.     (Mostly dos functions suffer from this bug, but some intuition
  93.      functions require this as well).
  94.  
  95. o)    Memory attributes:
  96.     Do NOT set ANY undocumented bits for the memory attributes of
  97.     AllocMem(). They *might* be ignored for this version of the Os,
  98.     but probably won't the next version. Check the exec/memory.h
  99.     file for valid flags. As for the current (V40) version of the Os,
  100.     the following flags have been defined:
  101.  
  102. #define MEMF_ANY    (0L)        /* Any type of memory will do */
  103. #define MEMF_PUBLIC (1L<<0)    /* Damn important, see caveats above !*/
  104. #define MEMF_CHIP   (1L<<1)    /* for custom chips */
  105. #define MEMF_FAST   (1L<<2)    /* explicitly fast mem, see caveats! */
  106. #define MEMF_LOCAL  (1L<<8)     /* Memory that does not go away at RESET */
  107. #define MEMF_24BITDMA (1L<<9)   /* DMAable memory within 24 bits of address */
  108. #define MEMF_KICK   (1L<<10)    /* Memory that can be used for KickTags */
  109.  
  110. #define MEMF_CLEAR   (1L<<16)   /* AllocMem: NULL out area before return */
  111. #define MEMF_LARGEST (1L<<17)   /* AvailMem: return the largest chunk size */
  112. #define MEMF_REVERSE (1L<<18)   /* AllocMem: allocate from the top down */
  113. #define MEMF_TOTAL   (1L<<19)   /* AvailMem: return total size of memory */
  114.  
  115. o)    Memory contents:
  116.     Do NOT MAKE any asumption about the contents of the memory block
  117.     unless you specified the MEMF_CLEAR attribute to erase the memory
  118.     block. Not setting this bit is a bit faster, but results in a 
  119.     memory block with whatever contents you might dream of.
  120.  
  121. o)    Self modifying code:
  122.     Self modifying code should be avoided. 
  123.     (What do thing this is? A C64? :-)
  124.     If you absolutely MUST play with this and can't go 'round this,
  125.     use the following Os call to flush the CPU caches once you've
  126.     placed your code in memory and need to run it:
  127.  
  128.     ClearCacheU()
  129.  
  130.     Do NOT expect that it is there BEFORE you called this routine.
  131.     This is even more important to routines like interrupts that are
  132.     called asynchroniously.
  133.  
  134. o)    Failures:
  135.     Feel prepared that your memory request might fail. An explicit
  136.     check is REQUIRED after an AllocMem() call. Just "going guru" in
  137.     this case *IS NOT ENOUGH*. Print a warning message, abort your
  138.     program safely, CHECK YOUR CODE!
  139.  
  140.     Assembly language authors: NO, IT'S NOT DOCUMENTED THAT AllocMem()
  141.     SETS THE ZERO BIT IF THE ALLOCATION FAILED. YOU'VE TO TEST THAT
  142.     YOURSELF.
  143.  
  144.     If your calling task is indeed a process, OS versions V37 and
  145.     above guarantee to set the result code for IoErr() to
  146.     ERROR_NO_FREE_STORE    (=103L).
  147.  
  148. o)    Memory flushers:
  149.     The following is a safe memory flush:
  150.  
  151.     AllocMem(0x7ffffff0,MEMF_PUBLIC);
  152.  
  153.     (The flush used by the "avail flush" command).
  154.  
  155.  
  156. o)     AllocMem() and context switches:
  157.  
  158.     Neither AllocMem() (nor FreeMem()) break a "Forbid" state. This is
  159.     important because it's the only way to "print" a list thru the
  160.     dos.library and other functions that is access protected 
  161.     via Forbid(). 
  162.  
  163.     The following code sequence is legal for this purpose, and should
  164.     stay legal:
  165.  
  166.     - call Forbid() first,
  167.     - make a copy of that list element by element, using AllocMem()
  168.     - call Permit().
  169.     - print the copy of the list
  170.     - deallocate the copy.
  171.  
  172.     Running into a Wait(), like using a semaphore for access protection
  173.     of the memory list memory would be fatal here.
  174.  
  175.  
  176. o)     AllocMem,FreeMem,AllocAbs and interrupts:
  177.  
  178.     NONE of these functions can be called from interrupts or in the
  179.     supervisor mode.
  180.  
  181.     Remember, however, that "input handlers" of the input.device
  182.     are not run as interrupts but in the context of the input.device
  183.     task, even though they are build on top of an interrupt structure.
  184.     Thus, calling AllocMem() here to make a copy of an input event IS
  185.     LEGAL.
  186.  
  187. _____________________________________________________________________________
  188.  
  189. Usage of stack for storing: (Or, how to allocate memory without allocating it)
  190.  
  191. It's a somewhat vague point whether the stack can be used for storing
  192. system/Os structures or for passing structures to other tasks. The following
  193. paragraph is my own interpretation of this technique and should be used with
  194. some care:
  195.  
  196. The CURRENT Os implementation allows this technique. The stack is allocated
  197. with the MEMF_PUBLIC flag set, AND MUST BE ALLOCATED THIS WAY. This is simply
  198. due to the fact that the memory for the stack is allocated by the task that
  199. creates a new process, and not by the new process itself. Since the AmigaOs
  200. doesn't know the unix fork() style of creating new processes, this is the
  201. only way of allocating the stack for the new process anyways. Thus, the stack
  202. is kept in memory that is passed across task boundaries and must be,
  203. therefore, public. Thus, it can be used for storing Os structures and for
  204. passing data accross processes. It's furthermore common practice to use
  205. the stack to pass "taglists" to Os functions that might be read by a 
  206. different process, and even to keep complete Os structures on the stack, as
  207. done by some CBM shell commands, routines in the dos.library and others. 
  208. (However, see the note below about how strict CBM/AI read their own 
  209.  design rules!)
  210.  
  211.  
  212. HOWEVER, Ralph Babel writes in "The Amiga Guru Book" (2nd ed., 1993):
  213.  
  214. "The stack is private memory ... and should not be considered MEMF_CHIP
  215. or MEMF_PUBLIC, nor should it be used for storing system structures or code.
  216. The latter is important, since there is no guarantee that the stack is
  217. aligned to an even address, as these processors also allow nonbyte data
  218. acesses from any base address, although opcodes must still be word aligned."
  219.  
  220. I do not agree in this point with Ralph except that the stack is indeed
  221. usually not MEMF_CHIP and shouldn't be considered to be. Storing code on
  222. the stack is truely considered "higher magic" and should be avoided. 
  223. (Also see above for caveats IF YOU ABSOLUTELY HAVE to do this.)
  224.  
  225. However, I would suppose that stack memory is always MEMF_PUBLIC for 
  226. reasons stated above, and it's always word aligned since the MC68K keeps 
  227. track of this themselfes unless you really attempt to screw the stack up. 
  228. Normal usage of stack does not break this alignment as even a
  229.  
  230.     move.b d0,-(a7)
  231.  
  232. instruction will decrement the stack pointer BY TWO BYTES, NOT BY ONE.
  233. This is one of the lesser known features of the MC68K series, indeed, and
  234. goes for all processors, from the MC68000 to the MC68060.
  235.  
  236. You should, however, still remember that you must align stack memory
  237. to four byte boundaries by hand. The following code snipped shows how to
  238. reserve 256 bytes of stack aligned to a longword boundary:
  239.  
  240.     lea -$104(a7),a7    ;reserve 256 bytes plus 2+2 for alignment.
  241.                 ;we use the extra two bytes to keep
  242.                 ;a possible long word alignment of the 
  243.                 ;stack and to avoid speed penalties for
  244.                 ;the more advanced processors. If you write
  245.                 ;your own routines, you should always allocate
  246.                 ;stack memory this way since the Os always
  247.                 ;generates tasks with the stack pointer
  248.                 ;aligned to four byte boundaries.
  249.  
  250.     move.l a7,d0
  251.     addq.l #2,d0        ;round up
  252.     and.b #$fc,d0        ;to next four byte boundary
  253.     move.l d0,a0        ;pass pointer in a0
  254.  
  255. However, most C compilers are not smart enough to for this technique. Even
  256. AI fall into that pithole when writing the "List" and "Dir" commands. Both
  257. don't align DOS structures to long words correctly. (Urgh!) But since a 
  258. similar code sequence is used sucessfully by the "DoPkt()" routine 
  259. inside the dos library, I would still say that using stack for Os structures 
  260. is legal and continues to stay legal. Allocating each tiny structure from
  261. the stack would create a huge overhead and would fragmentate memory a lot.
  262.  
  263. However, as I said, this is a somewhat vague point, you don't have to
  264. agree with me and I'm open for a discussion.
  265. _____________________________________________________________________________
  266.  
  267. o)    Size of deallocation:
  268.     Deallocation size MUST MATCH ALLOCATION SIZE PRECISELY. It is 
  269.     BY NO MEANS ALLOWED to
  270.  
  271.     - round the size because the rounding algorithm of the operating
  272.       system might change in future to support special hardware
  273.       (e.g. PowerPC cache lines which are 32 bytes wide)
  274.  
  275.  
  276.     Now to another rule that hasn't been formulated in the RKRMs:
  277.  
  278.     - free a partial memory block, i.e. parts of an array.
  279.       THIS IS DEFINITELY ILLEGAL, NO EXCEPTIONS, NO EXCUSES.
  280.       Free ALL OR NOTHING.
  281.  
  282.     Freeing a partial part of a memory block requires knowledge of
  283.     the alignment rules of the Os and may break code if these rules
  284.     change in future versions.
  285.  
  286.     I would therefore strongly recommend NOT to use this technique.
  287.  
  288.  
  289. o)    Access to deallocated memory:
  290.     Do not touch deallocated memory. If it's gone it's gone and you're
  291.     no longer allowed to use it, address it, read it or write data to
  292.     it. Another task might want it.
  293.  
  294.  
  295.     A tiny exception that hasn't been formulated in the RKRMs, but is
  296.     unfortunately widely used:
  297.  
  298.     Deallocation of memory WITHIN a Forbid()/Permit() pair. The memory,
  299.     EXCEPT FOR THE FIRST EIGHT BYTES WHICH ARE USED FOR ADMINISTRATION,
  300.     is guaranteed to stay unmodified and ready for use as long as
  301.     the multitasking is disabled. Running into a Wait(), directly or
  302.     indirectly, will break the Forbid() state and will therefore make
  303.     the memory unusable.
  304.  
  305.     Be warned! Even though this access is sort of legal, hence 
  306.     tolerated by MungWall, MemSniff, PoolMem and others, it's IMHO 
  307.     still ugly and therefore highly discouraged. One of the very few 
  308.     exceptions where this feature might be helpful is the following 
  309.     code segment that unloads the segment of a load- and stay resident 
  310.     program:
  311.  
  312.     move.l SysBase(a4),a6
  313.     jsr _LVOForbid(a6)
  314.     move.l DOSBase(a4),a6
  315.     move.l Segment(a4),d1
  316.     jsr _LVOUnloadSeg(a6)        ;Unload own code
  317.     move.l a6,a1            ;THIS CODE STAYS LEGAL because
  318.     move.l SysBase(a4),a6        ;of the Forbid()
  319.     jsr CloseLibrary(a6)        ;close dos
  320.     moveq #0,d0
  321.     rts                ;exit.
  322.  
  323.  
  324. o)    Chip memory and blitter access.
  325.     The custom "blitter logic" uses DMA and accesses the chip memory
  326.     independent of the CPU. If you use a temporary buffer for the blitter,
  327.     make sure the blitter does no longer access this buffer before you
  328.     deallocate it. To be on the safe side, call WaitBlit() before de-
  329.     allocating memory that has been used as blitter buffer.
  330.  
  331. o)    Memory and hardware DMA access.
  332.     Modern hard disk interfaces might access memory by DMA, parallel
  333.     to the CPU. If you're planning to use this hardware DMA directly
  334.     because you're writing a device driver for this hardware, be
  335.     prepared to flush the CPU caches properly. Especially, call
  336.     
  337.     CachePreDMA(...)
  338.         prior the DMA operation
  339.  
  340.     CachePostDMA(...)
  341.         afterwards.
  342.  
  343.     Check the autodocs for details about these functions and their
  344.     parameters.
  345.  
  346.  
  347. o)    Return value:
  348.     FreeMem() DOES NOT return any useful value, nor does it set any
  349.     condition codes.
  350.  
  351. ______________________________________________________________________________
  352.  
  353. AllocAbs and other wierdos:
  354.  
  355. AllocAbs is for specialized usage of allocating memory from a predefined
  356. location. DO NOT USE IT WITHOUT GOOD REASON.
  357.  
  358. o)    Range of allocated memory:
  359.     AllocAbs performs some rounding. Be prepared that the memory block
  360.     you get is not identical to the memory block you requested.
  361.     However, IF the memory allocation could be satisfied, the requested
  362.     memory block is guaranteed to be contained in the returned memory
  363.     block.
  364.     Feel prepared that the memory request cannot be satisfied because
  365.     the requested memory is already in use by a different task. 
  366.  
  367.     AllocAbs() returns NULL in this case. You've to check for this
  368.     explicitly! It does NOT set any condition codes.
  369.  
  370.     AllocAbs() WILL NOT set the ERROR_NO_FREE_STORE return code for
  371.     IoErr().
  372.  
  373. o)    Contents of allocated memory:
  374.     Do not make any asumptions about the contents of the 
  375.     allocated memory block. The OS uses parts of the free memory blocks
  376.     for administratory purposes and might have been trashed parts of
  377.     memory block. 
  378.  
  379.     That means especially for reset resident programs - whose memory is
  380.     allocated this way by the exec KickMemPtr mechanism - that the 
  381.     first eight bytes will be trashed. Be prepared for that feature!
  382.  
  383. o)    Deallocation of AllocAbs()-ed memory:
  384.  
  385.     To be sure that the allocated memory is really deallocated completely,
  386.     call FreeMem with the memory address and size you REQUESTED, NOT
  387.     with the return value of AllocAbs(). This might sound strange indeed,
  388.     but the FreeMem() logic performs the same rounding of size and address
  389.     as the AllocAbs() logic. If, however, you pass in a different address,
  390.     as the return value instead of the requested address, it is not
  391.     guaranteed that really all memory is deallocated.
  392.  
  393.     A tiny example might be helpful (asuming the the current rounding
  394.     algorithm):
  395.  
  396.     AllocAbs(0x07,0x300007);
  397.  
  398.     allocates 16 bytes and returns 0x300000. Calling now
  399.  
  400.     FreeMem(0x300000,0x07);
  401.  
  402.     will only free EIGHT bytes starting from 0x300000 instead of
  403.     16 bytes. However,
  404.  
  405.     FreeMem(0x300007,0x07);
  406.  
  407.     will work as required.
  408.  
  409.  
  410.     I'm sorry to say that the kludge documented in the last revision 
  411.     of this file failed for the same reason; this has been fixed.
  412.     
  413.  
  414. o)    Using AllocAbs() for aligned memory allocation:
  415.     The following code segment is a kludge for allocating memory aligned 
  416.     to a boundary:
  417.  
  418. void *AllocAligned(ULONG bytesize,ULONG attributes,ULONG alignment)
  419. {
  420. UBYTE *mem,*res;
  421.  
  422.     alignment--;
  423.     if (mem=AllocMem(bytesize+alignment,attributes & (~MEMF_CLEAR))) {
  424.         Forbid();
  425.         FreeMem(mem,bytesize+alignment);
  426.         mem = (mem + alignment)&(~alignment);
  427.         res = AllocAbs(bytesize,mem);
  428.         Permit();
  429.         if (res) {
  430.             if (attributes & MEMF_CLEAR)
  431.                 memset(mem,0,bytesize);
  432.         } else mem = NULL;
  433.     }
  434.     return mem;
  435. }
  436.  
  437.     I.e, call this routine with "aligment" set to 16 for an alignment
  438.     to a sixteen byte boundary.
  439.     Calling this routine with anything but a power of two for the
  440.     alignment doesn't make much sense and is illegal.
  441.  
  442. _____________________________________________________________________________
  443.  
  444. Any program that obeys these rules won't have *any* problems with PoolMem!
  445. _____________________________________________________________________________
  446.  
  447. Debugging tools (memory related):
  448.  
  449.  
  450. The following two debugging tools are "official" AI tools and should be used
  451. by any serious developer:
  452.  
  453. -Enforcer:    Detects memory accesses to the vector base and to unmapped
  454.         memory regions.
  455.  
  456. -MungWall:    Detects a lot of illegal accesses as in the list above,
  457.         as failing to initialize memory properly, accessing de-
  458.         allocated memory and others. However, it *could* do more.
  459.  
  460. -SegTracker:    Keeps program names together with their loaded segments
  461.         for easy identification of code.
  462.  
  463.  
  464. Even a program that runs without problems with these tools is not
  465. necessarely bug free!
  466.  
  467. The use of the following debugging tools is highly recommended:
  468.  
  469. -PatchWork:    (by Richard Körber)
  470.         Detects invalid parameters to Os calls.
  471.  
  472. I would also recommend the following combination: Since this is my own
  473. stuff, I can't be very objective. You might want to check them out....
  474.  
  475. - COP:        (my own stuff)
  476.         Catches gurus and exceptions "on line" for straight 
  477.         forewards debugging.
  478.  
  479. - MemSniff:    Even pickier than MungWall. It detects software failures
  480.         and memory problems MungWall can't find. However, check
  481.         the documentation as this tool has its special "caveats".
  482.         It should be used in conjunction with COP since it doesn't
  483.         generate an as complete output as MungWall or Enforcer.
  484.  
  485. - SaferPatches:    Detects illegal function patches. If this one crashes with
  486.         a guru, something is wrong. For details, check the doc
  487.         of the SaferPatches archive.
  488. _____________________________________________________________________________
  489.  
  490. Another set of wierdos for the "enlighted". (-:
  491.  
  492. The following is a list of "OS features" you should be aware of if you
  493. consider writing your own memory tool. I found them when writing PoolMem,
  494. so they are here for your information. However, DO NOT USE THESE TECHNIQUES
  495. in own code.
  496.  
  497. Even though the above rules have been setup for the developer, that doesn't
  498. mean that the Os respects these rules ("Quod licet Iovi non licet bovi.").
  499.  
  500.  
  501. I found the following "OS features":
  502.  
  503.  
  504. - The FFS (all versions V37 thru V43) expect a return value of "-1" for
  505.   FreeMem(). It is said that this will be fixed.
  506.  
  507. PoolMem contains a kludge for that. MemSniff and MungWall will mess up
  508. the registers on purpose.
  509.  
  510. - The layers.libray allocates memory in large blocks, but deallocates this
  511.   large block of memory in a series of small deallocations. In other words,
  512.   it breaks up large memory blocks in smaller ones.
  513.     
  514. The current version of PoolMem respects this behaviour, not only for the 
  515. layers.library. MungWall and MemSniff include special kludges to allow this
  516. EXCLUSIVELY for the layers.library. However, THIS HAS BEEN ILLEGAL, IS 
  517. ILLEGAL AND WILL CONTINUE TO BE ILLEGAL. I hope that this mess will be 
  518. cleaned up in a future Os revision. 
  519.  
  520. - Some programs expect the Z (zero) flag of the CPU after an AllocMem() 
  521.   call to be set on failure and to be cleared if the allocation worked.
  522.   THIS IS UNDOCUMENTED.
  523.  
  524. The current version of PoolMem contains a kludge to make these programs
  525. working.
  526.  
  527. - Some Os functions allocate Os structures from the stack and pass them
  528.   to other tasks. (The DoPkt() routine is one example, but there are others).
  529.  
  530. I would still say that this is O.K., but if you don't want to follow me in
  531. this point, it's an Os bug.
  532. _____________________________________________________________________________
  533.  
  534. Thomas Richter,        April 1998
  535.